4 research outputs found

    Machine Learning Based Physical Activity Extraction for Unannotated Acceleration Data

    Get PDF
    Sensor based human activity recognition (HAR) is an emerging and challenging research area. The physical activity of people has been associated with many health benefits and even reducing the risk of different diseases. It is possible to collect sensor data related to physical activities of people with wearable devices and embedded sensors, for example in smartphones and smart environments. HAR has been successful in recognizing physical activities with machine learning methods. However, it is a critical challenge to annotate sensor data in HAR. Most existing approaches use supervised machine learning methods which means that true labels need be given to the data when training a machine learning model. Supervised deep learning methods have outperformed traditional machine learning methods in HAR but they require an even more extensive amount of data and true labels. In this thesis, machine learning methods are used to develop a solution that can recognize physical activity (e.g., walking and sedentary time) from unannotated acceleration data collected using a wearable accelerometer device. It is shown to be beneficial to collect and annotate data from physical activity of only one person. Supervised classifiers can be trained with small, labeled acceleration data and more training data can be obtained in a semi-supervised setting by leveraging knowledge from available unannotated data. The semi-supervised En-Co-Training method is used with the traditional supervised machine learning methods K-nearest Neighbor and Random Forest. Also, intensities of activities are produced by the cut point analysis of the OMGUI software as reference information and used to increase confidence of correctly selecting pseudo-labels that are added to the training data. A new metric is suggested to help to evaluate reliability when no true labels are available. It calculates a fraction of predictions that have a correct intensity out of all the predictions according to the cut point analysis of the OMGUI software. The reliability of the supervised KNN and RF classifiers reaches 88 % accuracy and the C-index value 0,93, while the accuracy of the K-means clustering remains 72 % when testing the models on labeled acceleration data. The initial supervised classifiers and the classifiers retrained in a semi-supervised setting are tested on unlabeled data collected from 12 people and measured with the new metric. The overall results improve from 96-98 % to 98-99 %. The results with more challenging activities to the initial classifiers, taking a walk improve from 55-81 % to 67-81 % and jogging from 0-95 % to 95-98 %. It is shown that the results of the KNN and RF classifiers consistently increase in the semi-supervised setting when tested on unannotated, real-life data of 12 people

    "Mikä aihe ja mikä väri?" : sukupuolen vaikutus 5-6 -luokkalaisten lasten piirustusten aihevalintoihin

    No full text
    Tämän tutkimuksen tarkoituksena oli kartoittaa 11 - 12-vuotiaiden tyttöjen ja poikien piirustusten aihevalintoja sekä heidän värin käyttöään. Tutkimuksen toisessa osassa selvitettiin tyttöjen ja poikien ennalta määrätyn tarinan pohjalta syntyneistä piirustuksista löytyviä eroja. Tutkimuksen taustana oli fenomenologinen lähtökohta.Tutkimuksen teoriaosuudessa esitettiin lasten piirustusten aihevalintaan vaikuttavia psykologisia syitä, tyttöjen ja poikien menestymisen eroja kouluaineissa, eroja piirtämisen aihevalintojen alueella sekä lasten kuvaamataidollisen ajattelun kehittymistä.Tutkimukseen osallistui tamperelaisen ala-asteen 11 - 12-vuotiaita oppilaita (N=99) viidensiltä ja kuudensilta luokilta. Näistä tyttöjä oli 51 ja poikia 48. Tutkimuksen empiirisessä osuudessa toteutettiin annetun tarinan pohjalta piirtämistehtävä, jonka tarkoituksena oli motivoida lapset vastaamaan kyselylomakkeen kysymyksiin. Tarinaan liittyvien avoimien kysymysten sekä vapaa-aiheisen piirustuksen aihe- ja värivalintaan liittyvien monivalintakysymysten pohjalta kerättiin aineisto, jota lähdettiin ratkaisemaan sekä kvantitatiivisesti että kvalitatiivisesti.Tutkimuksen kvantitatiivisen osuuden vastaukset esitettiin prosentteina. Kvalitatiivisesti tarkasteltiin koko otoksesta prosenttiosuuksien mukaan syntynyttä kahdeksaa perustyyppiä. Näihin perustyyppeihin otettiin tarkoituksenmukaisesti neljä oppilasta (2 tyttöä ja 2 poikaa) viidenneltä luokalta sekä yhtä monta tyttöä ja poikaa kuudennelta luokalta. Perustyyppejä tarkasteltiin valittujen aihepiirien mukaan, joita olivat tarinaan liittyvät aihe, henkilö, ympäristö ja värin käyttö.Tulokset osoittavat, että tytöt ja pojat piirsivät ennalta määrätystä tarinasta sellaisia asioita, jotka olivat joko mielenkiintoisia tai helppoja toteuttaa. Heidän välillään esiintyi joitakin pieniä eroja tarinan aihevalinnoissa. Vapaa-aiheisen piirustuksen aihevalinnoissa havaittiin myös sukupuolesta johtuvia eroja. Värin käytön alueella ei esiintynyt suuria eroja tyttöjen ja poikien välillä. Tyttöjen ja poikien piirustusten aihevalintoihin vaikuttivat heidän kuvaamataidollinen kehitystasonsa ja kasvatukselliset tekijät. Näiden alueiden ottaminen mukaan tutkimukseen on yksi mahdollinen jatkotutkimusaihe.Asiasanat: piirustukset - lapset, sukupuolierot - koululaiset, kuvallinen ilmaisu - lapset, piirustus - lapset - sulupuolierot, värit - käyttö - lapse
    corecore